Resumo: Com a ascensão do comércio eletrônico, mais pessoas estão comprando produtos na internet. Para aumentar a satisfação, os comerciantes estão disponibilizando espaços para clientes comentarem sobre seus produtos e serviços. Produtos com comentários positivos atraem clientes, enquanto produtos com comentários negativos afastam clientes. Seguindo esta ideia, algumas pessoas e organizações estão escrevendo comentários falsos, a fim de promover ou de denegrir a imagem de um produto ou serviço. A dificuldade em encontrar estes comentários está na grande quantidade de informação disponível. Uma solução é o uso de técnicas e ferramentas da mineração de dados, em especial a classificação. Explorando esta situação, o objetivo deste trabalho é avaliar técnicas de classificação para identificar comentários falsos sobre produtos e serviços na internet. O trabalho também apresenta uma revisão de literatura sobre comentários falsos. A pesquisa utilizou oito algoritmos. Os algoritmos foram treinados e testados com uma base de dados de hotéis. O algoritmo CONCENSO apresentou o melhor resultado, com uma precisão de 88%. Após o primeiro teste, os algoritmos treinados classificaram comentários em outra base de dados de hotéis. Para comparar os resultados desta nova classificação, o algoritmo do Review Skeptic foi utilizado. Os algoritmos SVM e GLMNET apresentaram as melhores convergências com o algoritmo do Review Skeptic, classificando 83% dos comentários com o mesmo resultado. A pesquisa contribuiu ao demonstrar a habilidade dos algoritmos em entender a veracidade dos comentários sobre produtos e serviços na internet. Outra contribuição é ser o pioneiro na investigação de comentários falsos no Brasil e na engenharia de produção.
Abstract: With the e-commerce growth, more people are buying products over the internet. To increase customer satisfaction, merchants provide spaces for product and service reviews. Products with positive reviews attract customers, while products with negative reviews lose customers. Following this idea, some individuals and corporations write fake reviews to promote their products and services or defame their competitors. The difficulty for finding these reviews was in the large amount of information available. One solution is to use data mining techniques and tools, such as the classification function. Exploring this situation, the present work evaluates classification techniques to identify fake reviews about products and services on the Internet. The research also presents a literature systematic review on fake reviews. The research used 8 classification algorithms. The algorithms were trained and tested with a hotels database. The CONCENSO algorithm presented the best result, with 88% in the precision indicator. After the first test, the algorithms classified reviews on another hotels database. To compare the results of this new classification, the Review Skeptic algorithm was used. The SVM and GLMNET algorithms presented the highest convergence with the Review Skeptic algorithm, classifying 83% of reviews with the same result. The research contributes by demonstrating the algorithms ability to understand consumers’ real reviews to products and services on the Internet. Another contribution is to be the pioneer in the investigation of fake reviews in Brazil and in production engineering.